Arquitectura para conversión texto-habla multidominio

نویسندگان

  • Francesc Alías
  • Xavier Sevillano
  • Pere Barnola
  • Joan Claudi Socoró
چکیده

this paper presents an evolution in the design of multi-domain unit selection text-to-speech (MD-TTS) architecture. The goal of this approach is to achieve good synthetic quality like the limited domain TTS systems, without discarding a general purpose synthesis. The multi-domain architecture entails a speech corpus containing several domains. Moreover, it has been hierarchically structured by means of independent component analysis in order to optimize the unit selection process. On the other hand, MD-TTS demands a module capable to classify the texts in multiple domains, considering the system requirements.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Clasificación de textos adaptada para Conversión de Texto en Habla Multidominio

This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the inpu...

متن کامل

Dialogue System Based on EDECÁN Architecture

References ‣ Lleida, et al.: “EDECÁN: sistEma de Diálogo multidominio con adaptación al contExto aCústico y de AplicacióN”. IV Jornadas en Tecnología del Habla, Zaragoza, Spain, November, 2006. ‣ García, et al.: “Arquitectura distribuida para el desarrollo de sistemas de díalogo hablado, EDECÁN”. V Jornadas en Tecnología del Habla, Bilbao, Spain, November, 2008. ‣ EDECÁN Project, http://www.ede...

متن کامل

PHILIPS: Intelligent Speech Interpretation - la tecnología inteligente de reconocimiento de voz

Resumen: Independientemente de la aplicación, el núcleo de cualquier sistema de reconocimiento de voz sigue siendo la inteligencia que convierte el habla en texto. Al reconocer lo que se dice e interpretarlo de forma razonable, garantiza una intervención mínima en el proceso de trascripción para producir informes útiles. Palabras clave: Philips, SpeechMagic, reconocimiento del habla, tecnología...

متن کامل

Buscadores de Contenidos para Bibliotecas Digitales: Desarrollo de una Arquitectura para un Buscador XML

Resumen. El gran crecimiento del volumen de datos en las bibliotecas digitales hace necesario el desarrollo de buscadores de información que permitan al usuario encontrar rápida y eficazmente aquello que requieren. El etiquetado XML de los textos permite incorporar información estructural en los contenidos digitales. Las enormes posibilidades de explotación de estos contenidos hacen posibles se...

متن کامل

Modelo de duración para conversión de texto a voz en euskera

This paper presents the modelling of phone durations in standard Basque, to be included in a text-to-speech system. The statistical modelling has been done using binary regression trees and a large corpus containing 57.300 phones. Several experiments have been performed, testing different sets of predicting factors. The result when predicting durations with this model has a RMSE of 22.23 ms.

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 31  شماره 

صفحات  -

تاریخ انتشار 2003